智能论文笔记

Component-wise Analysis of Automatically Designed Multiobjective Algorithms on Constrained Problems

Yuri Lavinas , Gabriela Ochoa , Claus Aranha

分类：神经与进化计算 | 人工智能

2022-03-25

多目标算法的性能随问题而变化，因此很难开发新算法或将现有的算法应用于新问题。为了简化新的多目标算法的开发和应用，对组件零件的自动设计产生了越来越多的兴趣。这些自动设计的元启发式学可以胜过其人类开发的对应物。但是，仍然不确定什么是导致其性能提高的最有影响力的组成部分。这项研究介绍了一种新方法，以研究自动设计算法的最终配置的影响。我们将此方法应用于基于IRACE软件包设计的分解（MOEA/D）的表现良好的多物镜进化算法，该算法是在9个受约束问题上设计的。然后，我们将算法组件的搜索轨迹网络（STN），人群的多样性和HyperVolume的影响对比。我们的结果表明，最有影响力的组件是重新启动和更新策略，性能和更明显的度量值的增长更高。同样，它们的相对影响取决于问题的难度：在MOEA/D表现更好的问题中，不使用重新启动策略更具影响力；尽管更新策略在MOEA/D执行最差的问题中更具影响力。

translated by 谷歌翻译

Search Trajectories Networks of Multiobjective Evolutionary Algorithms

Yuri Lavinas , Claus Aranha , Gabriela Ochoa

分类：神经与进化计算 | 人工智能

2022-01-27

了解多目标进化算法（MOEAS）的搜索动力学仍然是一个开放的问题。本文扩展了最新的基于网络的工具，即搜索轨迹网络（STNS），以模拟MOEAS的行为。我们的方法使用分解的想法，其中多物原理问题转化为几个单目标问题。我们证明，使用10个连续的基准问题和3个目标，可以使用STN来模拟和区分两种流行的多目标算法MOEA/D和NSGA-II的搜索行为。我们的发现表明，我们可以使用STN进行算法分析来提高对MOEAS的理解。

translated by 谷歌翻译

POLCOVID: a multicenter multiclass chest X-ray database (Poland, 2020-2021)

Aleksandra Suwalska , Joanna Tobiasz , Wojciech Prazuch , Marek Socha , Pawel Foszner , Jerzy Jaroszewicz , Katarzyna Gruszczynska , Magdalena Sliwinska , Jerzy Walecki , Tadeusz Popiela

分类：计算机视觉

2022-11-29

The outbreak of the SARS-CoV-2 pandemic has put healthcare systems worldwide to their limits, resulting in increased waiting time for diagnosis and required medical assistance. With chest radiographs (CXR) being one of the most common COVID-19 diagnosis methods, many artificial intelligence tools for image-based COVID-19 detection have been developed, often trained on a small number of images from COVID-19-positive patients. Thus, the need for high-quality and well-annotated CXR image databases increased. This paper introduces POLCOVID dataset, containing chest X-ray (CXR) images of patients with COVID-19 or other-type pneumonia, and healthy individuals gathered from 15 Polish hospitals. The original radiographs are accompanied by the preprocessed images limited to the lung area and the corresponding lung masks obtained with the segmentation model. Moreover, the manually created lung masks are provided for a part of POLCOVID dataset and the other four publicly available CXR image collections. POLCOVID dataset can help in pneumonia or COVID-19 diagnosis, while the set of matched images and lung masks may serve for the development of lung segmentation solutions.

translated by 谷歌翻译

Imitrob: Imitation Learning Dataset for Training and Evaluating 6D Object Pose Estimators

Jiri Sedlar , Karla Stepanova , Radoslav Skoviera , Jan Kristof Behrens , Gabriela Sejnova , Josef Sivic , Robert Babuska

分类：机器人 | 计算机视觉

2022-09-16

本文介绍了一个数据集，用于培训和评估方法，以估算由标准RGB摄像机捕获的任务演示中手持工具的6D姿势。尽管6D姿势估计方法取得了重大进展，但它们的性能通常受到严重遮挡的对象的限制，这在模仿学习中是一个常见的情况，而操纵手通常会部分遮住对象。当前，缺乏数据集可以使这些条件的稳健6D姿势估计方法开发。为了克服这个问题，我们收集了一个新的数据集（IMITROB），该数据集针对模仿学习和其他人类持有工具并执行任务的其他应用中的6D姿势估计。该数据集包含三个不同工具和六个操纵任务的图像序列，这些任务具有两个相机观点，四个人类受试者和左/右手。每个图像都伴随着由HTC Vive运动跟踪设备获得的6D对象姿势的准确地面真相测量。通过训练和评估各种设置中的最新6D对象估计方法（DOPE）来证明数据集的使用。数据集和代码可在http://imitrob.ciirc.cvut.cz/imitrobdataset.php上公开获得。

translated by 谷歌翻译

Benchmarking Multimodal Variational Autoencoders: GeBiD Dataset and Toolkit

Gabriela Sejnova , Michal Vavrecka , Karla Stepanova

分类：机器学习

2022-09-07

在过去的几年中，多模式变异自动编码器（VAE）一直是一项激烈研究的主题，因为它们可以将多种模态整合到联合表示中，因此可以作为数据分类和生成的有前途的工具。到目前为止，已经提出了几种多模式VAE学习的方法，但是它们的比较和评估相当不一致。原因之一是模型在实现级别上有所不同，另一个问题是，在这些情况下常用的数据集最初不是为评估多模式生成模型的设计。本文解决了这两个问题。首先，我们提出了一个用于系统多模式VAE训练和比较的工具包。其次，我们提出了一个合成的双峰数据集，旨在全面评估联合发电和交叉生成能力。我们通过比较最新模型来证明数据集的实用性。

translated by 谷歌翻译

Adam Mickiewicz University at WMT 2022: NER-Assisted and Quality-Aware Neural Machine Translation

Artur Nowakowski , Gabriela Pałka , Kamil Guttmann , Mikołaj Pokrywka

分类：自然语言处理

2022-09-07

本文介绍了亚当·米基维奇大学（Adam Mickiewicz University）（AMU）提交的《 WMT 2022一般MT任务》的踪迹。我们参加了乌克兰$ \ leftrightarrow $捷克翻译指示。这些系统是基于变压器（大）体系结构的四个模型的加权合奏。模型使用源因素来利用输入中存在的命名实体的信息。合奏中的每个模型仅使用共享任务组织者提供的数据培训。一种嘈杂的反向翻译技术用于增强培训语料库。合奏中的模型之一是文档级模型，该模型在平行和合成的更长序列上训练。在句子级的解码过程中，集合生成了N最佳列表。 n-最佳列表与单个文档级模型生成的n-最佳列表合并，该列表一次翻译了多个句子。最后，使用现有的质量估计模型和最小贝叶斯风险解码来重新列出N最好的列表，因此根据彗星评估指标选择了最佳假设。根据自动评估结果，我们的系统在两个翻译方向上排名第一。

translated by 谷歌翻译

A comprehensive survey on recent deep learning-based methods applied to surgical data

Mansoor Ali , Rafael Martinez Garcia Pena , Gilberto Ochoa Ruiz , Sharib Ali

分类：计算机视觉

2022-09-03

最小的侵入性手术是高度操作员，依赖于冗长的程序时间，导致患者疲劳和风险。为了减轻这些风险，实时系统可以通过提供对场景的清晰了解并避免在操作过程中避免错误估计来帮助外科医生导航和跟踪工具。尽管已经朝这个方向做出了几项努力，但缺乏不同的数据集，并且非常动态的场景及其在每个患者中的可变性都需要实现强大的系统的重大障碍。在这项工作中，我们对最新基于机器学习的方法进行了系统评价，包括手术工具定位，细分，跟踪和3D场景感知。此外，我们提出了这些发明方法的当前差距和方向，并在这些方法的临床整合背后提供了合理的理性。

translated by 谷歌翻译

Improving video retrieval using multilingual knowledge transfer

Avinash Madasu , Estelle Aflalo , Gabriela Ben Melech Stan , Shao-Yen Tseng , Gedas Bertasius , Vasudev Lal

分类：计算机视觉

2022-08-24

视频检索随着视觉模型的发展取得了巨大进展。但是，进一步改进这些模型需要其他标记的数据，这是一项巨大的手动努力。在本文中，我们提出了一个框架MKTVR，该框架利用了从多语言模型的知识转移来提高视频检索的性能。我们首先使用最先进的机器翻译模型来构建伪真实的多语言视频文本对。然后，我们使用这些数据来学习视频文本表示，其中英语和非英语文本查询在基于预审前的多语言模型的常见嵌入空间中表示。我们在四个英语视频检索数据集上评估了我们提出的方法，例如MSRVTT，MSVD，DIDEMO和CHARADES。实验结果表明，我们的方法在所有数据集上实现了最先进的结果，超过了先前的模型。最后，我们还在涵盖六种语言的多语言视频回程数据集上评估了我们的模型，并表明我们的模型在零拍设置中优于先前的多语言视频检索模型。

translated by 谷歌翻译

Development and Validation of ML-DQA -- a Machine Learning Data Quality Assurance Framework for Healthcare

Mark Sendak , Gaurav Sirdeshmukh , Timothy Ochoa , Hayley Premo , Linda Tang , Kira Niederhoffer , Sarah Reed , Kaivalya Deshpande , Emily Sterrett , Melissa Bauer

分类： (统计)机器学习 | 机器学习

2022-08-04

机器学习和临床研究社区利用现实世界数据（RWD）的方法，包括电子健康记录中捕获的数据（EHR）截然不同。虽然临床研究人员谨慎使用RWD进行临床研究，但用于医疗团队的ML会消费公共数据集，并以最少的审查来开发新算法。这项研究通过开发和验证ML-DQA来弥合这一差距，ML-DQA是基于RWD最佳实践的数据质量保证框架。 ML-DQA框架适用于两个地理位置的五个ML项目，分别是不同的医疗状况和不同的人群。在这五个项目中，共收集了247,536名患者的RWD，共有2,999项质量检查和24份质量报告。出现了五种可推广的实践：所有项目都使用类似的方法来分组冗余数据元素表示；所有项目都使用自动实用程序来构建诊断和药物数据元素；所有项目都使用了一个共同的基于规则的转换库；所有项目都使用统一的方法将数据质量检查分配给数据元素；所有项目都使用类似的临床裁决方法。包括临床医生，数据科学家和受训者在内的平均有5.8个人参与每个项目实施ML-DQA，每个项目平均进行了23.4个数据元素。这项研究证明了ML-DQA在医疗项目中的重要性作用，并为团队提供了开展这些基本活动的框架。

translated by 谷歌翻译

Careful What You Wish For: on the Extraction of Adversarially Trained Models

Kacem Khaled , Gabriela Nicolescu , Felipe Gohring de Magalhães

分类：机器学习

2022-07-21

最近对机器学习（ML）模型的攻击，例如逃避攻击，具有对抗性示例，并通过提取攻击窃取了一些模型，构成了几种安全性和隐私威胁。先前的工作建议使用对抗性训练从对抗性示例中保护模型，以逃避模型的分类并恶化其性能。但是，这种保护技术会影响模型的决策边界及其预测概率，因此可能会增加模型隐私风险。实际上，仅使用对模型预测输出的查询访问的恶意用户可以提取它并获得高智能和高保真替代模型。为了更大的提取，这些攻击利用了受害者模型的预测概率。实际上，所有先前关于提取攻击的工作都没有考虑到出于安全目的的培训过程中的变化。在本文中，我们提出了一个框架，以评估具有视觉数据集对对抗训练的模型的提取攻击。据我们所知，我们的工作是第一个进行此类评估的工作。通过一项广泛的实证研究，我们证明了受对抗训练的模型比在自然训练情况下获得的模型更容易受到提取攻击的影响。他们可以达到高达$ \ times1.2 $更高的准确性和同意，而疑问低于$ \ times0.75 $。我们还发现，与从自然训练的（即标准）模型中提取的DNN相比，从鲁棒模型中提取的对抗性鲁棒性能力可通过提取攻击（即从鲁棒模型提取的深神经网络（DNN）提取的深神网络（DNN））传递。

translated by 谷歌翻译